14 research outputs found

    Minería de datos educativos: Análisis del desempeño de estudiantes de ingeniería en las pruebas SABER-PRO

    Get PDF
    In Colombia, the Saber-Pro test has been created to support the evaluation and improvement of higher education in the country. This article, applies the CRISP-DM data mining methodology to perform a study of the results obtained in the Saber-Pro tests of engineering students in Antioquia (Colombia). Three analytical models are developed from 108 academic, economic and socio-demographic variables: 1) clustering about student types, 2) selection of the most influential factors in the results of the tests, and 3) prediction of performance in the tests from the selected factors. As a result, the most influential variables on the test result are: the number of dependents, teaching method, if the home is permanent, the academic character of the institution and economic facilities such as micro-gas oven and motorcycle.En Colombia, las pruebas de Estado Saber-Pro han sido diseñadas para apoyar la evaluación y el mejoramiento de la educación superior en el país. Aplicando la metodología de minería de datos CRISP-DM, se realiza un estudio de los resultados obtenidos en las pruebas Saber-Pro de estudiantes de ingeniería en Antioquia (Colombia). A partir de 108 variables académicas, económicas y socio demográficas se realizan 3 modelos analíticos: 1) agrupación de los tipos de estudiantes, 2) selección de los factores que más influyen en el desempeño de las pruebas, y 3) predicción del desempeño en las pruebas a partir de las variables seleccionadas.  Como resultado se encuentra que algunas de las variables más influyentes sobre el resultado de las pruebas son: el número de personas a cargo, método de enseñanza, si el hogar es permanente, el carácter académico de la institución y facilidades económicas como tener horno micro gas y motocicleta.En Colombia, las pruebas de Estado Saber-Pro han sido diseñadas para apoyar la evaluación y el mejoramiento de la educación superior en el país. Aplicando la metodología de minería de datos CRISP-DM, se realiza un estudio de los resultados obtenidos en las pruebas Saber-Pro de estudiantes de ingeniería en Antioquia (Colombia). A partir de 108 variables académicas, económicas y socio demográficas se realizan 3 modelos analíticos: 1) agrupación de los tipos de estudiantes, 2) selección de los factores que más influyen en el desempeño de las pruebas, y 3) predicción del desempeño en las pruebas a partir de las variables seleccionadas.  Como resultado se encuentra que algunas de las variables más influyentes sobre el resultado de las pruebas son: el número de personas a cargo, método de enseñanza, si el hogar es permanente, el carácter académico de la institución y facilidades económicas como tener horno micro gas y motocicleta.In Colombia, the Saber-Pro test has been created to support the evaluation and improvement of higher education in the country. This article, applies the CRISP-DM data mining methodology to perform a study of the results obtained in the Saber-Pro tests of engineering students in Antioquia (Colombia). Three analytical models are developed from 108 academic, economic and socio-demographic variables: 1) clustering about student types, 2) selection of the most influential factors in the results of the tests, and 3) prediction of performance in the tests from the selected factors. As a result, the most influential variables on the test result are: the number of dependents, teaching method, if the home is permanent, the academic character of the institution and economic facilities such as micro-gas oven and motorcycle

    Minería de datos de la salud: Sistema de votación de técnicas analíticas para identificar los factores que influyen en la realización de cirugías estéticas

    Get PDF
    At the global level, cosmetic surgeries have become constant procedures that require, as an indispensable step, attendance at an appointment, but many of these appointments do not culminate with a surgical procedure. In order to identify the factors that influence the performance of aesthetic surgeries, this article proposes an analytical model based on a voting system of several techniques such as correlation analysis, principal component analysis, decision trees, logistic regression and association rules. The analytical model is validated with data from a surgical office in the city of Medellín. The results indicate that patients who undergo a cosmetic surgery are those who: 1) claim to desire a second surgery; 2) the first surgery desired is facial, breast augmentation, bichectomy, abdominoplasty, implant and gluteal augmentation; 3) the body mass index is normal; 4) they do not have cigarette habits; And 5) have no family history of diabetes.A nivel mundial, las cirugías estéticas se han convertido en procedimientos de constante realización que requieren, como paso indispensable, la asistencia a una cita de valoración, pero muchas de estas citas no culminan con un procedimiento quirúrgico. Para identificar los factores que influyen en la realización de cirugías estéticas, en este artículo se propone un modelo analítico basado en un sistema de votación de varias técnicas como análisis de correlaciones, análisis de componentes principales, árboles de decisión, regresión logística y reglas de asociación. El modelo analítico es validado con los datos provenientes de un consultorio quirúrgico de la ciudad de Medellín. Los resultados indican que los pacientes que se realizan una cirugía estética son aquellos que: 1) manifiestan desear una segunda cirugía; 2) la primera cirugía deseada es facial, aumento mamario, bichectomía, abdominoplastia, aumento de implantes y glúteos; 3) el índice de masa corporal es normal; 4) no tienen hábitos de cigarrillo; y 5) no tiene antecedentes familiares de diabetes

    Discovering similarities in Landsat satellite images using the Kmeans method

    Get PDF
    This article different ways for the treatment and identification of similarities in satellite images. By means of the systematic review of the literature it is possible to know the different existing forms for the treatment of this type of objects and by means of the implementation that is described, the operation of the K-means algorithm is shown to help the segmentation and analysis of characteristics associated to the color. In this type of objects, a descriptive analysis of the results thrown by the method is finally carried out

    Sorter of pornographic web pages based on the content of the images

    Get PDF
    La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo, parte del contenido ofrecido como la pornografía, es considerado inapropiado para algunos usuarios.  Para aportar al filtrado de pornografía en la web, este trabajo propone el desarrollo de un clasificador de páginas web basado en la evaluación de las imágenes presentes en el contenido de la página. La evaluación de las imágenes es realizada en tres vías: extracción de características de las regiones de piel, análisis de textura y descriptores de forma de la imagen. Los tres tipos de evaluación del contenido de las imágenes son utilizados para entrenar tres clasificadores con máquinas de soporte vectorial (SVM). Los resultados de clasificación son unidos en un ensamble realizado por un metaclasificador por medio de la siguiente política: si al menos uno de los tres clasificadores concluye que la imagen es pornográfica, entonces la imagen es considerada como tal. Al evaluar todas las imágenes contenidas en una página web, se utiliza la siguiente política: si la página web presenta un porcentaje de imágenes pornográficas superior al 30%, entonces la página es considerada como pornográfica. La implementación realizada es evaluada sobre un conjunto de 5000 páginas web diversas, obteniendo una exactitud del 84.6 % en el reconocimiento de contenido pornográfico a través del contenido de las imágenes.The World Wide Web, or web, is an information access and search logic system available on the Internet whose informative units are web pages. The web has facilitated the publication of big amount of information accessible from anywhere in the world; however, part of this content such as pornography is regarded inappropriate for some users. To contribute to the pornography filtering on web, this paper proposes the development of a web pages classifier based on the evaluation of the images present in the webpage content. The images evaluation is done in three ways: features extraction of skin regions, texture analysis and by the shape descriptors of the image. The three types of the images content evaluation are used to train three classifiers with Support Vector Machines (SVM). The results of the SVM classification are put together in an assembly made by a metaclassifier through the following policy: if at least one of the classifiers finds that the image is pornographic, then the image is regarded as such. When assessing all the images contained in a webpage, the next policy is applied: if the webpage present a percentage above 30%, then the webpage is regarded as pornographic. The implementation done is evaluated on a set of 5000 web pages with some information kinds, getting an accuracy of 84.6% in the recognition of pornographic content through the content of the images

    Clasificador de páginas web pornográficas basado en el contenido de las imágenes

    Get PDF
    La World Wide Web, o simplemente web, es un sistema lógico de acceso y búsqueda de información disponible en Internet cuyas unidades informativas son las páginas web. La web ha facilitado la publicación de gran cantidad de información accesible desde cualquier lugar del mundo; sin embargo, parte del contenido ofrecido como la pornografía, es considerado inapropiado para algunos usuarios.  Para aportar al filtrado de pornografía en la web, este trabajo propone el desarrollo de un clasificador de páginas web basado en la evaluación de las imágenes presentes en el contenido de la página. La evaluación de las imágenes es realizada en tres vías: extracción de características de las regiones de piel, análisis de textura y descriptores de forma de la imagen. Los tres tipos de evaluación del contenido de las imágenes son utilizados para entrenar tres clasificadores con máquinas de soporte vectorial (SVM). Los resultados de clasificación son unidos en un ensamble realizado por un metaclasificador por medio de la siguiente política: si al menos uno de los tres clasificadores concluye que la imagen es pornográfica, entonces la imagen es considerada como tal. Al evaluar todas las imágenes contenidas en una página web, se utiliza la siguiente política: si la página web presenta un porcentaje de imágenes pornográficas superior al 30%, entonces la página es considerada como pornográfica. La implementación realizada es evaluada sobre un conjunto de 5000 páginas web diversas, obteniendo una exactitud del 84.6 % en el reconocimiento de contenido pornográfico a través del contenido de las imágenes

    Unsupervised Human Activity Recognition Using the Clustering Approach: A Review

    Get PDF
    Currently, many applications have emerged from the implementation of softwaredevelopment and hardware use, known as the Internet of things. One of the most importantapplication areas of this type of technology is in health care. Various applications arise daily inorder to improve the quality of life and to promote an improvement in the treatments of patients athome that suffer from different pathologies. That is why there has emerged a line of work of greatinterest, focused on the study and analysis of daily life activities, on the use of different data analysistechniques to identify and to help manage this type of patient. This article shows the result of thesystematic review of the literature on the use of the Clustering method, which is one of the mostused techniques in the analysis of unsupervised data applied to activities of daily living, as well asthe description of variables of high importance as a year of publication, type of article, most usedalgorithms, types of dataset used, and metrics implemented. These data will allow the reader tolocate the recent results of the application of this technique to a particular area of knowledg

    Machine learning approach applied to human activity recognition – an application to the VanKasteren dataset

    Get PDF
    Reminders are a core component of many assistive technology systems and are aimed specifically at helping people with dementia function more independently by compensating for cognitive deficits. These technologies are often utilized for prospective reminding, reminiscence, or within coaching-based systems. Traditionally, reminders have taken the form of nontechnology based aids, such as diaries, notebooks, cue cards and white boards. This article is based on the use of machine learning algorithms for the detection of Alzheimer’s disease. In the experimentation, the LWL, SimpleLogistic, Logistic, MultiLayerPercepton and HiperPipes algorithms were used. The result showed that the LWL algorithm produced the following results: Accuracy 98.81%, Precission 100%, Recall 97.62% and F- measure 98.80

    Minería multimedia: hacia la construcción de una metodología y una herramienta de analítica de datos no estructurados

    No full text
    This research addresses the development of multimedia mining projects by applying analytical techniques to texts, images, audio, and video. In order to develop these projects, a methodology to develop multimedia mining projects (Multimedia Analytical Methodology-MAM) is proposed. Likewise, the construction of a software tool (known as Multimedia Analytical Platform-PAM) which allows the analysis of multimedia mining is introduced. Methodology and platform are evaluated with two study cases on prediction of mammography abnormalities and analysis of medical imaging similarity. Results obtained allowed validating the steps proposed in the MAM methodology and using the PAM platform to extract the characteristics of medical images, to apply data mining techniques, and to satisfactorily evaluate the results obtained.Neste trabalho, aborda-se o desenvolvimento de projetos de mineração de dados multimídia com a aplicação de técnicas analíticas a textos, imagens, áudios e vídeos. Para contribuir para o desenvolvimento desses projetos, propõe-se uma metodologia para desenvolver projetos de mineração multimídia chamada Metodologia de Analítica Multimídia (MAM). Além disso, apresenta-se a construção de uma ferramenta (software) que permite a análise de mineração multimídia chamada Plataforma de Analítica Multimídia (PAM). A metodologia e a plataforma são avaliadas com dois casos de estudo sobre predição de anormalidades em mamografias e análises de similaridade em imagenologia médica. Os resultados obtidos permitiram validar os passos propostos na metodologia MAM e utilizar a PAM para extrair as características das imagens médicas, aplicar técnicas de mineração de dados e avaliar satisfatoriamente os resultados.En este trabajo se aborda el desarrollo de proyectos de minería multimedia con la aplicación de técnicas analíticas a textos, imágenes, audios y videos. Para aportar al desarrollo de estos proyectos, se propone una metodología para desarrollar proyectos de minería multimedia llamada Metodología de Analítica Multimedia (MAM). Así mismo, se presenta la construcción de una herramienta software que permite el análisis de minería multimedia llamada Plataforma de Analítica Multimedia (PAM). La metodología y la plataforma son evaluadas con dos casos de estudio sobre predicción de anormalidades en mamografías y análisis de similaridad en imagenología médica. Los resultados obtenidos permitieron validar los pasos propuestos en la metodología MAM y utilizar la plataforma PAM para extraer las características de las imágenes médicas, aplicar técnicas de minería de datos y evaluar satisfactoriamente los resultados obtenidos

    Data mining: Contributions and trends in the health service of smart cities

    Get PDF
    Entre las numerosas aplicaciones de la minería de datos se destacan los aportes al servicio de salud en ciudades inteligentes. Dichas aplicaciones tienen por objetivo mejorar la calidad de vida de los ciudadanos, prevenir enfermedades, facilitar la toma de decisiones y analizar datos provenientes de las instituciones de salud. Con el objetivo de apoyar el desarrollo de ciudades inteligentes, en este trabajo se presenta una revisión de avances y tendencias de la minería de datos en el servicio de salud. Entre los principales avances en minería de datos se pueden encontrar diversas técnicas, metodologías y plataformas que han sido utilizadas en el sector salud. Entre las tendencias se pueden identificar algunos desafíos como: análisis de textos e imágenes, metodologías con etapas de reprocesamiento e indexamiento de datos no estructurados y herramientas con soporte a minería multimedia.Among the applications of data mining, the contributions to health services in smart cities are highlighed. These applications are intended to improve the life quality of citizens, prevent disease, facilitate decision making and analyze data from health institutions. In order to support the development of smart cities, this paper presents a review in developments and trends of data mining in health services. In the data mining developments we can found techniques, methodologies and platforms that have been used in the health sector. In the data mining trends we can found some challenges in the health services: text and images analysis, data mining methodologies with a stage of unstructured data preprocessing and indexing, and data mining tools to support multimedia

    Sistema multi-agente para el apoyo a la gestion de inventarios en itil mediante el monitoreo distribuido de software y hardware en una red corporativa

    Get PDF
    Gestionar la información del inventario de software y hardware puede ser, para una organización, una tarea dispendiosa y a veces no alcanzable por la complejidad y el número de usuarios que en ella coexisten. Como un acer camiento a la solución de este problema, se plantea el diseño de un sistema multi-agente distribuido que implemente un monitor eo constante en tiempo real y usando la red corporativa, de los cambios en el software y hardware de las máquinas de los usuarios
    corecore